چگونگی تسهیم پاداش بین عامل ها در سیستم های چند عامله

پایان نامه
چکیده

سیستم های چندعامله ((mas راه حلی برای مسائل مطرح شده امروزه است که ویژگی هایی مانند توزیع شدگی، پویایی ، تطبیق پذیری، تنومندی، کارایی و قابلیت استفاده مجدد را فراهم می کند. از آنجا که محیط معمولا به اندازه کافی هوشمند نیست تا عاملهای انفرادی را در یک تیم همکارانه تشخیص صلاحیت دهد و سیگنال تقویتی اسکالر منفرد، تنها بازخورد قابل اطمینان است که تیم عامل های یادگیر دریافت می کند، انتساب امتیاز بین عاملی یکی از مسائل مهم در تحقق یادگیری تقویتی چندعامله ( (marlاست. معمولا، انتساب امتیاز چندعامله mca)) با یک تکنیک یکتا حل نمی شود. بدین منظور، این پایان نامه، روشی برای mca برمبنای اعتماد و شهرت درسیستم های marl توسعه می دهد. در روش پیشنهادی که انتساب امتیاز چندعامله مبتنی بر اعتماد (tmca) نامیده می شود، عامل نقاد (که مسئول توزیع تقویت بین عامل های یادگیر است) از مدل اعتماد و شهرت برای ارزیابی قابلیت اطمینان عامل های یادگیر تقویتی در انتخاب بهترین عمل در برخورد با هر حالت استفاده می کند. دو منبع اطلاعات اعتبار، اعتبار تعاملی و شهرت شاهدی را تحت چهار چوب یکسان به منظور استفاده از دانش و خبرگی همه ی عامل ها در سیستم ترکیب می کند و ارزیابی جامع از عمل انتخاب شده عامل در سیستم marl به منظور تسریع فرآیند یادگیری فراهم می کند. به منظور ارزیابی رویکرد پیشنهادی، این روش با زبان برنامه نویسی c-sharp پیاده سازی شده است. اثرات نوع وظیفه (وظیفه نوع and و نوع or روی حل مسئله mca مطالعه می کنیم. علاوه بر این، کارایی سیستم با وجود عدم قطعیت در محیط، به صورت اغتشاش در اعمال عامل بررسی می شود. نتایج برتری الگوریتم پیشنهادی را در مقایسه با روش قبلی و تنومندی آن در محیط مغتشش نشان می دهد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...

متن کامل

افزودن قابلیت تحمل پذیری خطا به متدولوژی MaSE برای سیستم های چند عامله

برنامه های کاربردی زیادی امروزه بر مبنای مفهوم سیستمهای چند عامله شکل گرفته اند و نیازمند این هستند که به طور پیوسته و بی وقفه کار کنند. سیستمهای چند عامله نیز از بروز خطا مصون نیستند. به همین دلیل لازم است که تحمل پذیری خطا به عنوان یک نیاز غیر وظیفه مندی تا حد امکان برای آنها تامین گردد. روش های ارائه شده برای تحمل پذیری خطا تا به حال، بیشتر مبتنی بر تکثیر عامل ها بوده اند که خود باعث پیچیدگی...

متن کامل

بررسی تجربی سازه های مهم در تعیین قراردادها. شاخص ها و پارامترهای پاداش مدیران عامل شرکت ها در ایران

این مقاله با استفاده از تئوری نمایندگی (کارگزاری) به بررسی دو موضوع مهم می پردازد: 1- ارتباط پاداش مدیران عامل شرکت ها در ایران با سود حسابداری. رشد سود و رشد ارزش افزوده بازار. 2- مطالعه سازه های مهم در تعیین پاداش مدیران عامل. در مورد اول. از اطلاعات شرکت های سودده پذیرفته شده در بورس اوراق بهادار تهران در مقطع سال های 1376 تا 1380 استفاده گردیده و از روش تحلیل واریانس و رگرسیون استفاده به عم...

متن کامل

مدل‌سازی چند عامله رشد سکونتگاه‌های غیررسمی در GIS برداری

بافت‌های اسکان غیررسمی یکی از پیچیده‌ترین مسائل برنامه‌ریزی شهری و پدیده‌ای چندبعدی و دارای شاخص‌های متعدد می‌باشد. فرایند رشد مکانی سکونتگاه‌های غیررسمی تحت تأثیر محرک‌های پیچیده درونی و بیرونی شکل می‌گیرد که استفاده توأم از روش عامل مبنا و سیستم اطلاعات مکانی به‌عنوان رویکرد اصلی این پژوهش می‌تواند راهکاری مناسب برای مدلسازی این فرایند باشد. هدف از انجام این تحقیق مدلسازی پدیده رشد سکونتگاه‌ه...

متن کامل

طراحی یک سیستم مذاکره الکترونیکی چند عامله چند موضوعه

مذاکرات در کسب و کارهای الکترونیکی با فرایند تصمیم گیری همراه است در این گونه مذاکرات سعی می شود تا طرفین شرکت کننده در مذاکره با وجود محدودیت های اطلاعاتی از یکدیگر و بعضاً نیازها و اولویت های متعارض با یکدیگر به توافق دوجانبه ای دست یابند. در این راستا سیستم های مذاکره الکترونیکی کارایی فوق العاده ای خواهند داشت. علاوه بر این با توجه به رشد فوق العاده بازارهای الکترونیکی استفاده از سیستم مذاکر...

15 صفحه اول

یادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک

در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده ریاضی و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023